Skip to main content

2.6 Filtrering av datasettutvalg

Filtrering av datasett gjøres gjennom å bruke kommandoene drop eller keep etter at man først har laget et datasett ved hjelp av en import-kommando:

 
import ds/BEFOLKNING_KJOENN as kjønn
drop if kjønn == '1'
 

If-betingelser kan brukes i mange sammenhenger i microdata.no, og kan bygges opp med de vanlige logiske operatorene:

  • Større enn: >

  • Mindre enn: <

  • Er lik: ==

  • Større enn eller lik: >=

  • Mindre enn eller lik: <=

  • Er ulik: !=

  • Eller: |

  • Og: &

For å fjerne personer under 18 år fra utvalget, kan en skrive følgende:

keep if alder >= 18

Verdi for manglende data ("missingverdier") kan angis på følgende måte:

sysmiss(<variabel>)

For å fjerne alle individer uten oppgitt lønnsinntekt, kan en da skrive:

drop if sysmiss( lonn )

Det er også mulig å trekke et tilfeldig utvalg av en datapopulasjon. Dette gjøres med kommandoen sample. For mer om syntax og eksempler, bruk kommandoen help sample.